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澳洲 坚果 果 仁 MIMYBAAL 基因 克隆 与 结构 功能 分 析 
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Jj 要 : 澳洲 坚果 (Macadamia integrifolia) 是 一 种 高 经 济 价 值 的 常 绿 坚果 树 ， 其 果 仁 富 含 
脂肪 酸 和 和 蛋白 等 营养 成 分 。 为 鉴定 澳洲 坚果 果 仁 中 与 营养 成 分 形成 相关 基因 , 该 研究 采用 转 
录 组 学 、 基 因 克 隆 、 问 光 定量 和 生物 信息 学 等 技术 从 澳洲 坚果 果 仁 营养 成 分 含量 显著 差异 品 
种 ' 桂 热 1 号 ;和 ‘A4’ 的 果 仁 转录 组 中 挖掘 调控 基因 。 结 果 表 明 : G) 转录 组 分 析 发 现 ' 桂 热 
1 号 " 相 比 "A4’ 果 仁 中 上 调 基 因 1 667 个 ， 下 调 基 因 1 798 个 ，KEGG 富 集 分 析 发 现 差异 基因 
主要 在 淀粉 和 糖 代谢 、 氨 基 酸 生物 合成 和 碳 代 谢 路 径 。 (2) 发 现 一 个 差异 表达 基因 
gene-LOC122077931 编码 R2R3-MYB 转录 因子 MYB44L， 并 采用 RACE 技术 在 ' 桂 热 1 号 
果 仁 中 克隆 了 MiMYB44L， 其 全 长 1 165 bp，OREF 长 度 999 bp， 编 码 332 个 氨基 酸 。 G) 
采用 生物 信息 学 技术 证 明 MiMYB44L 含有 R2R3-MYB 家 族 特 征 的 SANT 结构 域 ， 不 含有 
信号 肽 和 跨 膜 结构 域 , 含有 磷酸 化 位 点 。(4) 测定 了 10 个 澳洲 坚果 品种 果 仁 中 蛋白 质 含量 ， 
发 现 MiMYB44L 在 澳洲 坚果 高 蛋白 含量 品种 中 表达 显著 高 于 其 在 低 蛋 白 含 量 品种 中 的 表达 
量 ， 整 体 相 关系 数 0.34， 达 到 极 显著 水 平 。 该 研究 结果 为 深入 解析 MIMYBAAL 在 澳洲 坚果 
营养 成 分 形成 中 的 调控 作用 机 制 提 供 理论 指导 。 
关键 词 : 澳洲 坚果 ，MiMYB44L， 果 仁 ， 结 构 ， 表 达 分 析 
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Cloning, structural and function analysis of MiMYBAAL 


gene in kernels of Macadamia integrifolia 
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Abstract: Macadamia nut (Macadamia integrifolia) is an evergreen nut tree with high economic 
value. Its kernel is rich in nutrients such as fatty acid and protein, etc. In order to further explore 
the main regulatory genes related to nutrient formation in M. integrifolia kernels, transcriptomics, 
gene cloning, fluorescence quantification PCR and bioinformatics techniques were used to screen 
potential regulatory genes from the kernel transcriptomes of ‘Guire No. 1' and *'A4', which have 
significantly different nutrient content in M. integrifolia kernels. The results were as follows: (1) 
Transcriptome analysis showed that 1 667 genes were up-regulated and 1 798 genes 
down-regulated in ‘Guire No. 1' kernel compared with those of 'A4' kernel and KEGG 
enrichment analysis showed that the differential genes were mainly in starch and glucose 
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metabolism, amino acid biosynthesis and carbon metabolism. (2) A significant differential 
gene-LOC122077931 encoding the R2R3-MYB transcription factor MYB44L was discovered. 
The MiMYB44L gene was cloned in kernels of M. integrifolia variety ‘Guire No. 1’ using RACE 
technology, which was 1 165 bp in length, 999 bp in ORF in length, and encoded 332 amino acids. 
(3) Bioinformatics analysis confirmed the presence of the SANT domain in the MIMYB44L 
protein, a hallmark feature of the R2R3-MYB family. The protein lacked both a signal peptide and 
a transmembrane domain but featured phosphorylation sites. (4) The protein content in kernels of 
10 M. integrifolia varieties was determined. And it was found that the expression of MIMYBAAL 
gene in M. integrifolia varieties with high protein content was significantly higher than that in 
varieties with low protein content, and the overall correlation coefficient was 0.54, reaching a very 
significant level. The results of this study provide theoretical guidance for in-depth analysis of the 
regulatory mechanism of MiMYBAAL gene in the formation of protein content in M. integrifolia. 
Key words: Macadamia integrifolia, MIMY B44L., kernel, structure, expression analysis 


澳洲 坚果 (Macadamia integrifolia) 是 一 种 高 经 济 价值 的 常 绿 坚果 树 ， 原 产 于 澳大利亚 
东海 岸 的 热带 雨林 。 因 其 优质 的 可 食用 性 , 在 世界 各 地 的 热带 和 亚热带 无 霜 区 进行 商业 种 植 
(Yang et al., 2023) 。 澳 洲 坚 果 果 仁 的 主要 成 分 是 脂肪 、 和 蛋白 和 多 种 微量 元 素 等 (Wojdylo et 
al., 2022) 。 前 期 研究 表明 ， 澳 洲 坚果 果 仁 的 营养 成 分 含量 在 不 同 澳洲 坚果 种 质 之 间 变 化 较 
大 ， 果 仁 内 的 变异 系数 由 高 到 低 依次 为 Ca>Zn>P>Mg> 可 溶性 糖 >Fe> 蛋 白质 > 氨基 酸 
> 开 > 脂 肪 〈 谭 秋 锦 等 ，2021a) 。 主 成 分 分 析 可 将 主要 营养 成 分 聚 为 4 个， 和 氨基酸 组 分 因 
子 、 矿 物质 因子 、 脂 肪 因子 、 蛋 白质 因子 ， 累 积 贡 献 率 为 87.91%。 可 见 ， 蛋 白 组 分 在 澳洲 
坚果 果实 营养 成 分 中 具有 重要 作用 。 然 而 , 在 澳洲 坚果 研究 中 , 对 脂肪 酸 (Richards et al., 2020) 
和 微量 元 素 营 养 的 研究 较 多 (De Silva et al., 2023) ， 但 对 蛋白 含量 及 其 调控 的 研究 较 少 。 
蛋白 质 作为 重要 的 生命 大 分 子 ， 除 了 提供 营养 价值 外 ， 还 作为 转录 因子 (Zumajo-Cardona et 
al., 2023) 、 酶 (Gabrielli et al., 2022) 、 和 蛋白 复合 体 〈Gisriel et al., 2022) 参与 植物 生长 发 
育 和 抗 逆 等 多 种 生物 过 程 。 

其 中 ,，R2R3-MYB 转录 因子 MYB44 参与 逆境 抗 性 和 多 种 植物 激素 传导 调控 , 是 植物 激 
素 信 号 交互 的 关键 转录 因子 (Wang etal., 2023) 。 在 拟 南 芥 基因 组 中 ，AtMYB44 属于 第 22 
组， 保守 基 序 为 22.1 (TGLYMSPxSP) 和 22.2 CGxXFMxVVQEMIxxEVRSYM)  CStracke 
et al., 2001) ， 通 过 与 PYL9、WRKY70 等 蛋白 结合 从 而 调控 拟 南 芥 等 植物 的 抗 逆反 应 、 参 
与 乙烯 和 莱 莉 酸 等 激素 信号 传导 过 程 ， 其 自身 亦 受 转录 和 翻译 后 调节 。 例 如 ，AtMYB44 提 
高 拟 南 芥 对 桃 蚜 的 抗 性 是 通过 激活 乙烯 信号 途径 EIN2 实现 的 。MYB44 竞争 性 抑制 
MYB340-bHLH2-NACS56 复合 体形 成 进而 调控 紫 疡 甘薯 花 青 素 的 生物 合成 。AtMYB44 启动 
子 区 域 核 小 体 密度 低 , 便于 多 种 信号 的 转录 因子 调控 其 表达 。 在 调控 其 他 蛋白 的 相关 研究 中 ， 
发 现 牡丹 PSMYB44 通过 抑制 二 氧 黄酮 醇 -4- 还 原 酶 基因 表达 负 性 调节 花 办 斑点 分 布 (Luan et 
al., 2023) 。 来 自 中 国 野生 紫 葡萄 的 VaMYB44 转录 因子 负 调 控 转 基因 拟 南 芥 和 葡萄 植株 的 
耐寒 性 (Zhang etal., 2022) 。 综 上 可 知 ，MYB44 转录 因子 可 能 参与 澳洲 坚果 中 果实 营养 成 
分 含量 的 调控 。 本 研究 以 广西 壮族 自治 区 重要 经 济 果树 澳洲 坚果 为 研究 对 象 , 依托 澳洲 坚果 
高 低 果 仁和 蛋白 含量 差异 显著 品种 的 转录 组 数据 和 澳洲 坚果 ' 桂 热 1 号 ?品种 基因 组 数据 (Xia et 
al., 2022) ， 采 用 转录 组 学 、 基 因 克 隆 和 生物 信息 学 等 方法 ， 通 过 鉴定 果 仁 中 差异 显著 基因 
的 结构 与 功能 ， 拟 探讨 以 下 问题 : 〈1) 澳洲 坚果 果 仁 中 与 营养 成 分 形成 相关 的 主 效 调控 基 
因 是 哪些 种 类 ; (2) 基因 具有 哪些 特异 性 的 结构 与 功能 ;， (3) 不 同 澳洲 坚果 品种 果 仁 蛋白 
含量 积累 与 基因 表达 量 的 关系 如 何 。 本 研究 对 MYB 转录 因子 22 亚 家 族 成 员 MiMYB44L 进 
行 结构 分 析 、 表 达 分 析 以 及 表达 量 与 蛋白 含量 之 间 的 相关 分 析 等 ,为 深入 开展 澳洲 坚果 营养 
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成 分 的 转录 调控 研究 打下 理论 基础 。 
1 材料 与 方法 


1.1 材料 

试验 于 2021 一 2023 年 在 广西 壮族 自治 区 农业 科学 院 广 西南 亚热带 农业 科学 研究 所 澳洲 
坚果 种 质 资源 围 进行。 该 地 区 是 南亚 热带 季风 气息， 热量 丰富 ， 雨 量 充沛 ,日 照 充 足 。 选 取 
不 同 果 仁 蛋白 含量 显著 差异 的 10 dn PJW SRA ER 1 号 "B7B4…“ 皇 家 大 
果 ”B3”A38’ 和 “A4’ 果 仁 为 材料 测定 蛋白 含量 并 提取 RNA。 根据 本 单位 自主 研发 的 主推 品种 
FEA 1 号 基因 组 数据 、' 桂 热 1 号 :和 'A4?: 果 仁 转录 组 数据 筛 选 和 克隆 MIMYBAAL 基因 。 
1.2 MiMYB44L 克隆 与 表达 规律 分 析 

基因 克隆 采用 MiMYB44L-F1 5-TCCGTTTCTCTCATCTTCTC-3' 和 MiIMYBA4L-RI 
-GTCTGTCTTCCATCTTCAATC-3' 这 对 引物 进行 克隆 。 交 光 定 量 MiACTIN 为 内 参 基 因 和 
相应 的 荧光 定量 引物 为 MiMYB44L-QF 5'-AATCGCTCGTCTCCTCTC -3'fll MiMYB44L-QR 
5-GGCTTGAACCACCTGAAC -3';  MiACTIN-QF 5'-TCTTCATTGCCTGCACTCCAGA-3' 
和 MIACTIN-QR 5'-TTCCACCTGAATGCCGTCTAGC?'. 在 美国 Bio-rad (伯乐 ) 公 司 CFX96 
荧光 定量 PCR 仪 中 进行 反应 。 反 应 程序 参照 宋 海 云 等 (2023) 的 方法 ， 并 使 用 2-^4Ct 方 法 分 
析 处 理 菊 光 定 量 数据 〈 宋 海 云 等 ，2023) 。 
1.3 澳洲 坚果 蛋白 含量 测定 

蛋白 质 含量 测试 依据 中 华人 民 共 和 国 国 家 标准 《食品 安全 国家 标准 食品 中 和 蛋 白质 的 测 
XE) GB/T5009. 5 一 2016 中 的 凯 氏 定 氮 法 进行 测定 ( 谭 秋 锦 等 ，2021a) 。 
1.4 统计 分 析 

采用 Originpro 2021 科技 绘图 软件 和 Office 365 进行 数据 整理 。 所 有 基因 表达 实验 数据 
均 为 3 次 生物 重复 和 3 次 技术 重复 的 平均 值 和 标准 误 。 采 用 SPSS 27 版 本 对 数据 进行 单 因素 
方差 分 析 、 多 重 比较 分 析 和 相关 分 析 〈 宋 海 云 等 ，2023) 。 
2 结果 与 分 析 
2.1 澳洲 坚果 ' 桂 热 1 号 ;和 ‘A4’ 果 仁 转录 组 分 析 

采用 北京 百 迈 客 生物 科技 有 限 公 司 〈 中 国 北京 ) ÁI Mumin 高 通 量 测序 平台 对 澳洲 坚果 
高 蛋白 含量 品种 ' 桂 热 1 号 ;和 低 蛋 白 含量 品种 ‘A4’ 果 仁 的 转录 组 进行 分 析 。 共 获得 39.34 Gb 
Clean Data， 各 样品 Clean Data 均 达 到 5.92 Gb, Q30 碱 基 百 分 比 在 94.06% 及 以 上 。' 桂 热 1 
号 ' 比 ‘A4’ 果 仁 上 调 基 因 1 667 个 , 下 调 基 因 1 798 个 。 进 一 步 采 用 GO M KEGG 富 集 分 析 发 
现 差 异 基 因 主 要 在 淀粉 和 糖 代谢 、 氨 基 酸 生物 合成 和 碳 代 谢 路 径 〈 图 1: AO 。 随 后 发 现 一 
个 差异 基因 gene-LOC122077931， 编 码 R2R3-MYB 转录 因子 MYB44L， 在 ' 桂 热 1 号 "中 表 


达 量 显著 高 于 其 在 ‘A4’ 果 仁 中 的 表达 量 (图 1: B) 。 
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A.“ 桂 热 1 号 ”和 “A4” 果 仁 转录 组 KEGG 分 析 ; B. gene-LOC122077931 表达 分 析 。 
A. Transcriptome KEGG analysis in kernel of ‘Guire No. 1° and ‘A4’; B. gene-LOC122077931 expression 
analysis. 
图 1 ' 桂 热 1 号 ;和 “A4’ 果 仁 转 录 组 差异 表达 基因 的 KEGG 富 集 分 析 和 
gene-LOC122077931 基因 表达 分 析 
Fig. 1 KEGG enrichment analysis of differentially expressed genes in kernel of ‘Guire No. 1" 
and ‘A4’ and gene expression analysis of gene-LOC122077931 

2.2 MiMYB44L 的 生物 信息 学 分 析 

根据 澳洲 坚果 高 蛋白 含量 品种 ' 桂 热 1 号 "和 低 蛋 白 含 量 品种 “A4: 果 仁 的 转录 组 分 析 结 果 ， 
从 中 筛选 到 一 个 差异 显著 的 MYB 转录 因子 。 进 一 步 搜索 ' 桂 才 
坚果 : 桂 热 1 号 ?品种 果 仁 中 克隆 了 MIMYBAAL 基因 。 该 基因 核 背 酸 全 长 是 1 165 bp，cDNA 
编码 ORF 长 度 999 bp， 编 码 332 个 氨基 酸 (图 2) 。 其 编码 蛋白 分 子 量 36.3 kDa， 等 电 点 
8.19， 分 子 式 为 C1572H2486N464Os00S13， 总 原子 数 5 035， 不 稳定 系数 62.96， 是 不 稳定 蛋白 。 
脂肪 指数 67.26。 亲 水 性 值 -0.636， 为 疏水 性 蛋白 。 
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t ATGGCTTCTTCAAGGAAAGATATGGATCGGATCAAAGGACCGTGGAGCCCCGAGGAAGATGACTCGTTGCAGAAGCTTGTCCAGAAGCACGGCCCTAGGAATTGGTCCCTCATCAGCAAA 
X M AS S R KD MDRIK GPWISPEIEDDISLOQIÉKLIVOQEKHGIPRNHWSLISIK 
130 140 150 160 170 180 190 200 210 220 230 240 
121 TCCATCCCTGGGAGGTCTGGCAAGTCTTGTCGTCTCCGGTGGTGTAACCAGCTCTCTCCACAGGTGGAGCACAGAGCTTTTACGCCCGAAGAGGATGAGACGATCATCCGGGCGCACGCC 
41 S. y P G R S G K S C€ R L R W C N Q L S P Q V E H R A F T P EE D E TT IRARA 
250 260 270 280 290 300 310 320 330 340 350 360 
241 AAGTTTGGTAATAAATGGGCCACAATCGCTCGTCTCCTCTCTGGTCGTACCGACAACGCGATCAAAAACCATTGGAATTCGACCCTCAAGCGCAAATGCTCGTCCATGGTCGATGACGCC 
81 K FE 'G N K W A T1 I M R bL Lh 5 G E TD N ATEN H W N S T LK R K c S S M V b b X 
370 380 390 400 410 420 430 440 450 460 470 480 
361 AGCGACGATGCCCAAGCACACCAGCCGCTTAAGAGATCGAATAGTGCAGGCGCCGCAGTGGCTCCCGTCTCTTCGCTATATTTCAACAGCCCCAGCAGTCCCTCTGGATCCGATGTGAGT 
121 S D D A Q A H Q P L K R S N S A G A A V A P V S S L Y FN S P S S P S G S D V S 
490 500 510 520 530 540 550 560 570 580 590 600 
481 GACTCCAGTCTGCCCGTGATGTCTTCTTCTCATGTGTACCGACCTGTACCAAGAACGGGAGGGATCTTACCGCCATCTCAGCATCAGCAGCAGCTAGAAACGTCGTCGTCGACGAACGAT 
161 D SS LP VM S SSHVYRPVPRTGGILIPPSOQ)HO20ISOSOILIEITSSSSIT NOD 
610 620 630 640 650 660 670 680 690 700 710 720 
601 CCGCCTACCTCTCTCTGTCTCTCCCTCCCTGGAGCAGATTCTTGCGAGGTTTCTAATCATGTTTCAGGGGGTTCAGGTGGTTCAAGCCATGAAACAACCCCTAACCAACTACCCACTCCC 
201 P PT S LC LS LP GA DS CEWSNIHVMS GG S GG S SHETTI—?PN OO LIw?rP I TP 
730 740 750 760 710 780 790 800 810 820 830 840 
721 GTGGCTGTGCCTACAGCCGTTCCGTTGCAACAGTTTCCGCCACCCCAGCAGCAGCTTAATCAACATATACAGTACAACGATTTCGGATCATCGGAGGTTCCTTATGCGGAGAAACATTTT 
241 v B v PT A VP LQ OQrF P PrPOQ«oS]goTLmbNOIH SIgQoYSNODIE GS c S EUVMIrPISYS A EK HF 
850 860 870 880 890 900 910 920 930 940 950 960 
841 ATCCCTTTCAGTCCTGGGTTCCTTTCTGTGATGCAAGAAATGATCAAAAAGGAAGTTAGGAATTACATGTCTGGGCTTGAGCAGAACGAGCTGTGTCTACAAGCTGAAGGGATTAGGAAC 
281 IP FSPGFLSVHMQEHMIKRKEVRNYHMSGLEGQNIELCLOGQISAFEGIIRIN 
910 980 990 
961 GTTGCTGTGAAGCGTATTGGCATCAGCAAGATCGATTAG 
321 V A V K R T G PL S K I D * 


图 2 MiMYBAAL 基因 编码 区 核 苷 酸 和 氨基 酸 序列 
Fig.2 Coding region nucleotide and amino acid sequences of MiMYB44L 


为 进一步 分 析 MIMYBAAL 蛋白 的 结构 和 特殊 的 基 序 , 2H] NCBI 在 线 工 具 和 MEME 分 
析 网 站 进行 生物 信息 学 分 析 。 结 果 显 示 ， 澳 洲 坚果 MIMYBAAL 5:357 tE (Telopea speciosi 
ssima) 的 TSMYB44 和 和 荷花 (Nelumbo nucifera) 的 NnMYB44 蛋白 序列 相似 度 最 高 ， 聚 为 
一 个 亚 族 (图 3) 。 含 有 8 个 特征 的 基 序 : 1. HRAFTPEEDETIIRAHARFGNKWATIARLLS 
GRTDNAIKNHWNSTLKRKC; 2. DRIKGPWSPEEDEALQKLVQKHGPRNWSLISKSIPGRS 
GKSCRLRWCNQL; 3. QFFSAEFLAVMQEMIRKEVRNYMSGJEQN; 4. NPSSPSGSDVSDS 
SLPVMSSSHVYRPVARTGGVLPPVQTIE; 5. CLQAEGIRNAVVKRIGISKIE; 6. DPPTSLS 
LSLPGSDS; 7. HSQQPLKRSASAGAATPVSG; 8. MASTRKDV。 说 明 其 结构 与 植物 MYB 
44 家 族 和 蛋白 序列 一 致 。 
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— JcMYB44 


CsMYB44 


基 序 模块 基 序 序列 
Motif symbol Motif consensus 


. EBENEN HRAFTPEEDETIIRAHARFGNKWATIARLLSGRTDNAIKNHWNSTLKRKC 
[EU DRIKGPWSPEEDEALQKLVQKHGPRNWSLISKSIPGRSGKSCRLRWCNOL 
KQFFSAEFLAVMQEMIRKEVRNYMS 
SPSSPSGSDVSDSSLPVMSSSHVYRPVARTGGVLPPVOQIE 
CLOAEAIRNAVVKRIGISKIE 

NDPPTSLSLSLPGSD 

QQPLKRSASAGAATP 

SCEVSNRVSGS 


PcMYB44. 牧 豆 树 (XP 054775903.1 ) ; ApMYB44. 相思 子 CXP 027359981.1) ; StMYB44. 决 明 
(KAF7809869.1) ; GmMYB44. 大 豆 (XP 003524661.1) ; VrMYBA4. 贝 达 葡 萄 (XP 034691187.1) ; 
DfMYB44. 美洲 山茶 黄 CXP 059641739.1) ; NnMYB44. 荷花 (XP 010244270.1) ; MiMYB44L. 澳洲 坚 
果 ; TsMYB44. i3; € te (XP 043712840.1 ) ; CsMYB44. 茶树 (XP 028080167.1 ) ; ZjMYB44. X 
(XP_015884347.2) ; CpMYBA4. ARJA (XP_021903563.1) ; PaMYB44. 银白 杨 (XP_034897249.1) ; 
PvMYB44. 阿 月 浑 子 (XP 031272387.1) ; MeMYBA4. AK XE 〈XP 021601648.1 ) ; JeMYBA4. 麻风 树 
(NP. 001295712.1) ; AtMYB44. 拟 南 芥 (Q9FDW1.1) ; VaMYBAA4. 葡萄 (OM902065) ; PsMYB44. 1t 
丹 (cluster 20336) 。 下 同 。 
PcMYB44. Prosopis cineraria (XP. 054775903.1); ApMYBAA. Abrus precatorius, (XP. 027359981.1); SEMYBA4. 
Senna tora (KAF7809869.1); GmMYBA4. Glycine max (XP 003524661.1); VrMYB44. Vitis riparia 
(XP 034691187.1); DfMYBAÁ4. Cornus florida (XP 059641739.1)) NnMYBA44. Nelumbo nucifera 
(XP. 010244270.1); MIMYBAAL. Macadamia integrifolia, TSsMYBA4. Telopea speciosissima (XP. 043712840.1); 
CsMYBAA. Camellia sinensis (XP. 028080167.1); ZIMYBAA. Ziziphus jujuba (XP. 015884347.2); CpMYBAA. 
Carica papaya, XP 021903563.1; PaMYBA4. Populus alba (XP 034897249.1); PvMYBAA4. Pistacia vera 
(XP 031272387.1); MeMYBA4. Manihot esculenta (XP 021601648.1); JcMYB44. Jatropha curcas 
(NP 001295712.1); AtMYBAA4. Arabidopsis thaliana (Q9FDWI1.1); VaMYBAA. Vitis vinifera (OM902065); 
PsMYBAA. Paeonia suffruticosa (cluster 20336). The same below. 

图 3 MiMYB44L 与 其 他 植物 MYB 蛋白 氨基 酸 序列 进化 分 析 和 基 序 分 析 


Fig. 3 Amino acid sequence evolutionary analysis and motif analysis of MIMYB44L and 


ONDNAUN> 
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other plant MYB proteins 


经 过 对 蛋白 保守 结构 域 分 析 发 现 (图 4) ，MiMYB44L 与 其 他 植物 的 MYB 在 功能 域 序 
列 相似 度 高 ， 均 含有 SANT superfamily 结构 域 。 其 特征 为 在 8~173 氨基 酸 序列 中 含有 
MDRIKGPWSPEEDDSLQKLVQKHGPRNWSLISKSIPGRSGKSCRLRWCNQLSPQVEHRAF 
TPEEDETIIRAHAKFGNKWATIARLLSGRTDNAIKNHWNSTLKRKCSSMvddaSDDAQAHQ 
PLKRSNSAGAAVAPVSSLYFNSPSSPSGSDVSDSSLPVMSSSHVY 序列 。Myb 超 家 族 蛋 白 ， 
具有 转录 、RNA 加 工 和 修饰 、 细 胞 分 裂 和 染色 体 分 割 等 作用 。SANT 结构 域 结 合 端 粒 DNA 
# 联 重复 序列 的 串联 拷贝 是 加 帽 复合 体 的 一 部 分 。 对 于 包含 G/C 丰富 基 序 [C2-3 A (CAD 
1-6] 的 重复 序列 ， 其 结合 是 序列 依赖 性 的 。 该 结构 域 也 发 现 于 与 DNA 结合 的 调节 性 转录 抑 
趾 物 复合 物 中 ， 在 所 有 物种 中 极端 保守 。 和 蛋白 特性 图 (图 5) 显示 MiMYB44L 和 蛋白 为 疏水 
性 蛋白 ， 不 含有 跨 膜 结构 域 和 信号 肽 。 主 要 含有 丝氨酸 、 苏 氨 酸 和 酷 氨 酸 的 磷酸 化 位 点 。 


Tn 
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^A Query seq. 


lina bindins site 
Specific hits 


Non-specific PLNO3212 ] 


hits = 
Superfanilies SANT superfamily 
PLNO3212 superfamily 


REB1 superfamily 


MİMYB44L 124 
CmMYB44 126 
B MeMYB44 125 
JcMYB44 124 
TsMYB44 124 
NnMYB44 125 
VIMYB44 125 
CÊMYB44 125 
2ZjMYB44 124 
PCMYBAA 130 
StMYB44 1n 
ApMYB44 112 
CSMYB44 127 
BaMYB44 123 
PvMYB44 124 
CpMYB44 126 
SANT 超 家 族 SANT superfamil 
MiMYB4A4L — .. Bu IG 1L] j GGSSHETTPNQLPTPV 241 
GMMYB44 a k VETI krai RRTTVEVMP 220 
j 231 
229 
239 
v 242 
VrMYB44 227 
CfMYB44 235 
ZjMYB44 226 
PCMYB44 241 
StMYB44 219 
ApMYB44 211 
CSMYB44 218 
PaMYB44 220 
BVMYB44 223 
CpMYB44 231 
MİMYB44L .. TAVPLOQFPPPQQOOLN! : F p 7 x TP 332 
GmMYB44 VNTVAAPAPV. „A „iSc R É E 294 
MeMYB44 .. B.. IQDVHTPVAQ 315 
JcMYBA44 ..P.. TEVVOTPAMP 313 
TSMYB44 TLP.. TAVPVQQFAS 3 327 
NnMYB44 SLPPPTVVPLOQVSQ 5 Y L 330 
VrMYB44 IP. AMAPLQQI PME. 3 LHRQPATVPATVLSQG A 312 
CfMYB44 PPPOP MN N F PRMPISVSEKRYGGIPAAEVPSPSP A 354 
2jMYBA44 ..P.. TQNLHPQTPA [si 313 
PCMYB44 è SATALTAAST A 348 
StMYB44 TMEFLSGMASVAP. A 295 
ApMYB44 IPLLPIMTAPVPV. iv 299 
CSMYB44 IATPPAPP. 294 
PaMYB44 TPVAPPPAAVTAQQQ! QI PAAQQNY. 305 
PYMYBA4 S8. NNMVQPQVAQË. .... LVQNH. 299 
CpMYB44 ..L..PHQVTPSVGPPOPPPPL.. .QVoTTSQG... 315 


4 MiMYBA4L 与 其 他 植物 MYB 蛋白 保守 结构 域 分 析 
Fig. 4 Conservative domains analysis of MiMYB44L and other plant MYB proteins 
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A. IRI; B. 亲 水 性 分 析 ; C. 磷酸 化 分 析 :; D. 信号 肽 分 析 。 
A. Transmembrane analysis; B. Hydrophilic analysis; C. Phosphorylation analysis; D. Signal peptide analysis. 


图 5 MiMYB44L 蛋白 特性 分 析 
Fig.5 Analysis ofthe MiMYB44L protein properties 


在 蛋白 保守 结构 域 分 析 的 基础 上 ， 进 一 步 分 析 了 MIMYBAAL 的 二 级 和 三 级 结构 。 
MiMYB44L 二 级 结构 中 a- 螺 旋 为 86 氨 基 酸 , 占 比 25.90%。 延 长 链 为 19 个 氨基 酸 , H tE 5.72%. 
B- 转 角 10 个 氨基 酸 ， 占 比 3.01%。 随 机 卷曲 217 氨基 酸 ， 占 比 65.36% (图 6)。 
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SOPMA: 
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以 螺旋 Alpha helix (Hh) : 86 is 25.90% 

3 螺旋 310 helix (GE) : eis  e.eex 

Pi ¿jẹ Pi helix (Ii) : eis 0.00% 

B ft Beta bridge (Bb) : eis  e.eex 

3E-&& Extended strand (Ee). : 19 is  5.72X 

p 转角 Beta tum (Tt) : 10 is 3.01% 

"dX Bend region (^-) : eis  e.eex 

pld Random coil (€c) : 217 is 65.36% 
HS5 Ambiguous states (?) : eis 0.00% samt 

其 他 态 Other states : eis 0.00% 


. 二 级 结构 分 析 ; B. 三 级 结构 模型 。 
A. Secondary structural analysis; B. Tertiary structure model. 
图 6 MiMYB44L 蛋白 结构 分 析 
Fig.6 Analysis of the MIMYB44L protein structure 


4) BT EESA 1757, 'A3SURITW'SS 10 个 品种 澳洲 坚果 果 仁 中 的 蛋白 含量 表明 ， 和 蛋白 含量 
TNI 进一步 提取 10 个 品种 果 仁 的 RNA 分 析 表 明 , MIMYBAAL 在 ‘JTW* 和 “SH? 
等 高 蛋白 含量 品种 中 表达 量 最 高 ， 在 ‘A4”B4’ 等 品种 中 表达 量 最 低 CD 。 和 蛋白 舍 量 和 表 
达 量 的 相关 系数 为 0.54 (P=0.002) ， 达 到 显著 水 平 。 
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图 7 10 个 澳洲 坚果 品种 果 仁 蛋白 含量 和 MiMYB44L 表达 分 析 


Fig. 7 


3 讨论 
研究 转录 因 


于 


素 含量 变化 规律 发 


周 控 澳洲 坚果 
经 开展 了 相关 的 生 到 


varieties 


AE 


j= 


蛋白 含量 的 分 子 机 制 和 栽培 技术 的 报道 较 少 , 但 是 国 
LE 与 分 子 生物 学 研究 。 例 如 ,在 
见 ， 随 着 果实 的 生长 ， 包 括 脂 类 、 糖 类 和 醇 类 、 氨 基 酸 、 


完 澳洲 坚果 早期 花 


'AJAU BRI AL6" A38. ‘SH’ 
"Huangjia fruit’ 


Protein contents and MiMYB44L expression levels in kernels of ten Macadamia 


内 外 已 
序 的 代谢 物 和 内 源 激 
有 机 酸 和 核 昔 酸 


在 内 的 大 部 分 差异 累积 代谢 物 在 果实 中 显著 降低 。 除 氨基 酸 外 , 大 部 分 差异 累积 代谢 物 在 叶 


D: 


中 显著 增加 。 
ERAH 


( 谭 秋 锦 等 ，2021b 


Wl. BW 


移动 的 MYB44 ffi 


COlukayode et al., 2023) 。 


的 稳定 性 
物 中 发 现 和 证 
TERRE P 
BEBE VITTE T 


H 


与 弱 花 序 相 比 ， 强 花序 果实 
CYang et al., 2023) 。 


分 进行 研究 ， 发 现 果 仁 营养 成 分 均 以 脂肪 为 主 。 其 中 ， 
100g-1!,“A4” 种 质 的 脂肪 
Jo 


a TE 


促进 热 激 胁迫 诱导 的 黄瓜 叶绿素 
明 MYB44 的 新 功能 ， 在 热带 乔木 中 也 相继 证 
证 明 HbMYB44 受 多 种 激素 信号 
导 茶 合 成 又 

赋予 了 其 在 不 同 植物 中 具 


在 澳洲 坚果 种 质 资 


含量 最 


ARE 


FT 


调节 磷酸 转运 和 蛋 
植物 激素 脱落 


调控 对 干旱 的 抗 性 (Hao 
有 类 似 


结构 域 ， 与 蒂 罗 花 和 荷花 的 MYB44 人 
录 家 族 的 成 员 之 一 。 
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MYB44L 转录 抑制 分 支 中 。PsMYB44 位 于 细胞 核 中 ， 其 时 空 表达 模式 与 斑点 形成 呈 负 相关 
(Luan et al., 2023) 。 可 见 ， 可 以 采用 进化 、 转 基因 等 新 技术 证 明 MiMYB44L 在 澳洲 坚果 
果 仁 营养 成 分 合成 中 具有 的 转录 调控 作用 。 下 一 步 ， 可 采取 进化 分 析 方法 分 析 不 同 物种 中 
MYB44 的 进化 关系 并 分 析 复 制 事件 。 提 取 10 个 蛋白 含量 显著 差异 品种 的 基因 组 DNA， 扩 
增 每 个 品种 基因 组 中 的 MIMYBAAL 基因 全 长 ， 分 析 外 显 子 和 内 含 子 结果 ， 并 与 蛋白 、 脂 肪 
酸 等 营养 含量 进行 相关 性 分 析 。 构 建 了 带 有 35s x 2pro 强 启动 子 和 GFP 标签 的 pGREEN 载 
体 ， 进行 烟草 瞬时 表达 实验 证 明 该 基因 的 功能 。 在 本 研究 的 基础 上 ， 建立 澳洲 坚果 的 遗传 转 
化 体系 ， 采 用 过 表达 和 敲 除 MiMYB44L 基因 的 方法 证 明 其 对 蛋白 等 营养 成 分 含量 的 调控 ， 
对 促进 澳洲 坚果 品质 育种 的 发 展 具有 重要 意义 。 


4 结论 T5 


MiMYBAAL 蛋白 含有 R2R3-MYB 家 族 特征 的 SANT 结构 域 ， 是 典型 的 R2R3-MYB f£ 
录 因 子 。MiMYB44L 基因 在 澳洲 坚果 高 蛋白 含量 品种 中 表达 水 平 显著 高 于 其 在 低 蛋 白 含 量 品 
种 中 的 表达 量 ， 相 关系 数 为 0.34， 达 到 显著 水 平 。 
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